スタージェスの公式の活用

 度数分布表を作成するに当たって,データの個数に対してどれだけの階級を設定すればよいか迷うところである。
例えば,1枚の硬貨を6回投げて表が出た回数を調べるとき,表は 0 回から 6 回までの 7 通りあり,表裏の出方は全部で \(2^6=64\)(通り)ある。
そこで,このすべての場合が起こったとすれば,64 個のデータを 7 つの階級に分類することになる。 この考え方により,\(2m\) 個のデータに対して,階級数を \(m+1\) に設定することが一般的と言われている。
より一般的に記述すると,データ数を \(N\),階級数を \(k\) とすると,
\begin{align} k=1+\log_{2} N (スタージェスの公式) \nonumber\\ \end{align} と表されることになる。(注 \( \log_{2}N \) は2を底とする対数,数学Ⅱで学習する。) 階級数 \(k\) が決まれば,階級幅 \(c\) は,データの範囲 \(R\)(=最大値-最小値)から
\begin{align}   c= \frac{R}{k} \nonumber\\ \end{align} で決定できる。
 ここで示した階級数と階級幅は,1つの目安と考えてもらえばよい。